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基于 搜索 的 分 层 回 归 测 试 数据 集 扩 增 方法 


EEI, m Fo MZ% 
(西安 邮电 大 学 计算 机 学 院 , 西安 710121) 


摘 要 : 针对 在 回归 测试 中 原 有 的 测试 数据 集 往往 难以 满足 新 版 本 软件 的 测试 需求 问题 ， 提 出 一 种 基于 搜索 的 分 层 回 
归 测 试 数据 集 扩 增 方 法 ， 主 要 包含 覆盖 目标 方法 集 获 取 模 块 和 测试 数据 生成 模块 。 首 先 对 新 版 本 程序 进行 抽象 分 析 ， 
提取 出 方法 调用 图 ， 利 用 方法 调用 轨迹 和 已 有 测试 数据 建立 方法 覆盖 信息 ， 获 取 目 标 方法 集 ， 并 通过 计算 贝 叶 斯 条 件 
概率 对 目标 方法 集 进行 优先 选择 ; 利用 Hadamard 撼 阵 设计 正 交 种 群 ， 同 时 结合 已 有 测试 数据 集 进 行 种 群 初 始 化 ， 采 
用 文化 基因 算法 对 目标 集中 方法 生成 测试 数据 。 该 方法 针对 四 个 基准 程序 与 随机 法 和 遗传 算法 以 及 基于 粒子 群 算 法 测 
试 数据 生成 方法 相 比 , 测试 数据 的 生成 效率 平均 提高 了 95.2%、78.2% 和 50.5%, 测试 数据 检 错 能 力 平均 提高 了 47.9%, 
33.6% 和 18.2%， 实 验 结果 表明 ， 该 方法 更 适合 回归 测试 数据 扩 增 。 

关键 词 : 方法 调用 图 ; 回归 测试 数据 扩 增 ; 正 交 种 群 ; 文化 基因 算法 
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- Search-based hierarchical regression test suite augmentation method 


Wang Shuyan, Gao Lu, Sun Jiaze 
(School of Computer Science & Technology, Xi' an University of Posts & Telecommunications, Xi'an 710121, China) 


Abstract: It is difficult for the original test data to meet the requirements of the new version of software testing in regression 


testing, thus a search-based hierarchical regression test suite augmentation method was proposed to solve the problem. The 
© method mainly includes obtain the target function set module and the test data generation module. Firstly, it Abstract: 
: function call graph from the new program, and builds function coverage information use function traces and original test case 
set, afterwards, Bayesian conditional probability choose the target function set through calculating; Then using Hadamard 
matrix to design the orthogonal population, and initialization population with the combination of the orthogonal population 
and existing test data set. Finally, using the memetic algorithm to generate test data for target functions. Compared with the 
random algorithm based, the genetic algorithm based and particle swarm algorithm based test data generation methods on four 
benchmark programs, the generation efficiency of the proposed method was improved on average by approximately 95.2%, 
78.2% and 50.5% respectively, the error detection ability of the test case was improved on average by approximately 47.9%, 
33.6% and 18.2% respectively. The experimental results show that the proposed method is more suitable for regression test 
suite augmentation. 


Key words: function call graph; regression test suite augmentation; orthogonal population; memetic algorithm 


0 引言 存在 的 错误 或 潜在 问题 。 为 了 补充 原 有 测试 数据 集 的 完备 性 ， 
则 需要 对 原 有 测试 数据 集 进行 扩 增 。 据 统计 ,回归 测试 开销 一 般 
软件 测试 是 提高 软件 质量 和 软件 可 靠 性 的 重要 手段 ， 同 时 。” 占 整个 测试 预算 的 809675: 91, 因此 提高 回归 测试 效率 是 非常 
也 可 提高 被 测 软件 的 可 信 度 023。 回 归 测 试 是 指 测试 人 员 通 过 重 。 有 意义 的 。 
新 测试 新 版 本 软件 ， 以 确定 软件 中 没有 引入 新 的 错误 或 者 其 他 最 初 ，Menager 等 人 外 提出 了 测试 数据 扩 增 的 概念 ， 当 时 
潜在 错误 中 。 在 软件 生命 周期 中 ， 由 于 频繁 地 对 软件 进行 修改 ， ”提出 的 目的 是 为 对 应 测试 数据 集 的 约 减 方法 ， 因 此 并 没有 阐述 
使 得 原 有 测试 数据 集 往往 难以 满足 新 版 本 软件 的 测试 需求 ， 从 ”应 该 如 何 进行 回归 测试 数据 集 的 扩 增 。 近 些 年 来 ， 测 试 数据 扩 
而 难以 保证 覆盖 到 软件 新 增 和 发 生 改变 的 部 分 以 及 揭示 软件 中 增 方法 主要 分 为 两 大 类 ， 即 面向 行为 的 回归 测试 数据 扩 增 方法 
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和 面向 覆盖 的 回归 测试 数据 扩 增 方法 ， 前 者 主要 期 望 通 过 生成 ”方法 调用 轨迹 和 已 有 测试 数据 建立 方法 覆盖 信息 ， 根 据 方法 履 
的 测试 数据 集 来 描述 软件 新 增 部 分 和 修改 部 分 在 执行 上 的 变 盖 信 息 获 取得 到 覆盖 目标 方法 集 ， 依 据 贝 叶 斯 理论 计算 选择 可 


化 ， 后 者 期 望 生 成 的 测试 数据 集 可 以 覆盖 到 软件 新 增 部 分 和 修 。 ”能 被 引入 错误 方法 ， 得 到 优先 覆盖 目标 方法 ， 即 新 增 方法 和 修 
改 部 分 。 复 缺陷 后 可 能 存在 错误 的 方法 。 

Santelices 等 人 中 利用 符号 执行 技术 分 析 软 件 的 控制 流 图 和 "m —À 
数据 流 图 进行 测试 数据 的 扩 增 ， 提 出 回归 测试 扩 增 技术 应 满足 metam e exem 
状态 需求 和 链 需求 ， 随 后 将 PIE 模型 引入 到 回归 测试 数据 集 扩 aramas | | morana ||, [— 
增 方法 中 ,进一步 再 利用 符号 执行 和 约束 求解 获得 测试 数据 集 ; i 
Xu 等 人 四 提出 一 种 导向 测试 数据 集 扩 增 技术 , 主要 通过 分 析 测 wes o soin ent 
试 数据 的 再 执行 ， 来 获取 分 支 覆盖 目标 ， 即 未 被 任何 测试 数据 图 1 本 文 方法 框架 区 
覆盖 到 的 分 支 集 合 ， 再 结合 符号 执行 技术 生成 新 的 测试 数据 ， ”1.1 ”加 权 方法 调用 图 
Xu 等 人 中 进一步 遗传 算法 引入 测试 数据 扩 增 技术 中 ,并 分 析 了 方法 调用 图 为 一 个 有 向 图 ， 记 作 G ， 有 向 边 记 作 e 。 其 中 ， 
遗传 算法 参数 的 设置 对 扩 增 结果 的 影响 ，Zhang 等 人 do 提出 了 ”每 条 边 e 附 加 有 一 个 权重 W 。 本 文采 用 边 的 平均 执行 概率 作为 


种 基于 代码 的 回归 测试 方法 ,用 于 为 单元 测试 生成 测试 数据 ， ”权重 。 假 设 方法 调用 图 有 7 条 边 ， 每 条 边 在 执行 路 径 中 出 现 的 
主要 借助 分 析 程 序 的 树 形 结构 以 便 找 到 发 生 改 变 的 路 径 ， 将 分 。 次 数 分 别 是 ww,…w,， 则 边 e; 的 权 值 w, 的 公式 为 


支 路 径 作为 测试 数据 生成 主要 目标 。Xu 等 人 1 利用 原 有 测试 Lu 
数据 运行 修改 后 的 程序 ， 以 发 生 改变 的 语句 作为 目标 语句 ， 初 
种群 是 根据 目标 语句 的 个 数 在 已 有 测试 数据 集中 进行 选择 ， eC 
最 后 利用 遗传 算法 生成 覆盖 目标 语句 的 测试 数据 。 巩 敦 卫 等 人 对 于 同一 个 定点 的 出 边 的 权 值 和 为 1。 


09 分 析 原 有 测试 数据 穿越 的 路 径 与 目标 路 径 的 相似 度 ， 来 选取 


n 
2L Wi =1 
i-0 


部 分 测试 数据 集 作为 部 分 初始 种 群 ， 利 用 遗传 算法 进化 生成 测 

斌 数据， 吴川 等 人 U3 着 重 于 考虑 已 有 测试 数据 集 的 利用 ， 提 出 现在 有 方法 调用 图 如 图 2 所 示 。 

基于 分 析 路 径 相关 性 来 建立 数据 生成 数学 模型 并 用 遗传 算法 进 有 测试 用 例 各 =(81013) ， 其 方法 覆盖 路 径 为 
行 模型 求解 。 王 曙 燕 等 人 U4 提出 一 种 基于 自 适应 粒子 群 算法 的 。 mains fo fo Fo Fo Fo Fe Fo Fo ho Fo Fo Fe Rho 对 于 ts 在 
可 归 测 试 扩 增 方法 ， 利 用 路 径 相 似 度 识别 新 增 路 径 并 选取 初始 ”执行 时 ， 方 法 万 只 能 调用 方法 fo. BIE f, f, BUEN V, X 


种 群 ， 然 后 建立 测试 数据 集 扩 增 数学 模型 ， 最 后 采用 自 适应 粒 。 于 方法 户 , 其 可 调用 a por f, WAA AS f£. f, f, 
子 群 进行 求解 。 TI f, — ;分 别 出 现 的 次 数 为 2 次 ,1 次 和 1 次 ,因此 所 下 
在 上 述 回 归 测 试 数据 生成 的 方法 中 ， 都 将 测试 数据 的 覆盖 边 的 权 值 为 2/Q41«D-05 , f, — f, Xa f SU OS 
率 作为 测试 数据 生成 的 最 终 目 标 ， 而 忽略 了 测试 数据 集 的 缺陷 ”1M2+1+1)=0.25， — 户 边 的 权 值 为 1-0.5-0.25=0.25， 因 此 可 
检测 能 力 。 测 试 数据 作用 是 确保 用 尽量 少 的 测试 数据 去 发 现 程 。 以 得 到 在 三 执行 时 方法 的 加 权 方法 调用 图 如 图 3 所 示 。 计 算 测 
序 去 更 多 的 缺陷 。 本 文 从 测试 数据 的 覆盖 率 和 检 错 能 力 两 方面 。 试 数据 集 在 方法 调用 图 上 每 个 节点 出 边 的 权 值 ， 得 到 每 个 节点 
考虑 ， 在 文献 [14] 工 作 的 基础 上 ， 针 对 需要 进行 回归 测试 的 两 ”出 边 的 最 终 权 值 为 该 出 边 在 不 同 测试 数据 执行 时 的 调用 概率 的 


类 场景 生成 测试 数据 ， 一 类 是 软件 系统 新 增 若 干 方法 体 的 回归 ”平均 值 。 

测试 ， 一 类 是 程序 缺陷 修复 后 进行 的 回归 测试 ， 提 出 一 种 基于 amm 3 

搜索 的 分 层 回归 测试 数据 扩 增 方法 ， 本 文 的 分 层 是 指 依次 从 方 à Y 

法 级 别 和 语句 级 别提 取 履 盖 目 标 ， 即 先 从 方法 级 别提 取 目 标 方 " 

法 集 ， 包 括 新 增 或 者 发 生 改 变 的 方法 ， 再 针对 目标 方法 集 进行 © M 

静态 分 析 提 取 覆 盖 路 径 ， 以 期 降低 识别 提取 履 盖 目标 的 效率 。 s 
u : " 8 E -0. 25770. 5. 

利用 贝 叶 斯 理论 对 覆盖 目标 方法 集 进行 优先 选择 ， 针 对 目标 路 Q QIO 人 OIC 

径 集 利用 文化 基因 算法 (memetic algorithm, MA) 生成 测试 数 调 2 © 

据 ， 以 期 提高 测试 数据 的 覆盖 率 和 检 错 能 力 ， 从 而 降低 回归 测 人 

试 的 测试 成 本 。 本 文 方法 框架 ， 如 图 1 所 示 。 MO 

1 ”获取 覆盖 目标 方法 集 (æ) 1 


首先 得 到 程序 的 方法 调用 图 ， 将 其 用 邻接 矩阵 存储 ， 计 图 2 方法 调 图 3 加权 方 法 调用 图 
算 所 有 节点 出 边 的 平均 执行 概率 ， 得 到 加 权 方 法 调用 图 ， 根 据 
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1.2 方法 覆盖 信息 


自 定 一 个 软件 系统 由 7 个 组 件 C; 组 成 ,其 


pielen 
运行 结果 错误 的 


测试 执行 集合 T=7T; UT,， 其 中 7; 表示 测试 
IRANESE, T, 表示 测试 执行 结果 正确 的 测 
程序 覆盖 信息 是 一 个 2 维 矩 阵 。 
a din 
A=| : d. 31 
am Amn 


其 中 : 第 i (1<i<m) 行 
j (1x j <n) 列 为 测试 数据 二 ,二 ……， 


LR NUN PR 
p ， 如 果 测 斌 数据 


试用 例 集合 ， 则 


DUE E3 


qd 


0; HAE 


覆盖 了 方法 ff， 则 4;=1 ， 否 则 a; 
e=[e,:…,e,,: 
表示 第 j 个 测试 数据 的 执行 结 
e; 二 0， 则 (4A,e) 是 本 文 需要 
1.3 ”目标 方法 集 选择 


本 文 将 方法 覆盖 信息 (A,e) 作 为 输入 ， 得 到 目 


e 表示 测试 数据 的 执行 结 
果 ， 如 果 成 功 , We =1, 
的 方法 覆盖 信息 。 


R, 其 中 元 素 @， 
否则 


标 方法 集 


C, -|c eAlaj =0N(aj =1A6 =0)}， 即 新 增 方法 集 和 修 
改 后 可 能 包含 错误 的 方法 集 ， 其 中 ke[l,m]， 然 后 通过 贝 叶 # 
概率 计算 出 目标 方法 包含 错误 的 概率 ， 现 在 假定 方法 集 是 相互 
独立 的 ， 本 文 利用 贝 叶 斯 定理 计算 方法 集 C, 的 条 件 概率 为 
P P 
Peia=wxeelejzeu 
ple) 
其 中 : w, 是 第 大 个 节点 出 边 的 执行 概率 ， P(e) 是 一 个 标准 化 
常数 ， 由 所 有 c, 定义 ,无 需要 直接 计算 。 由 于 每 次 执行 都 是 独 
立 的 ， 故 
N 
)- I 1P(elc) Q) 
i-l 
其 中 ，P(e | c) 的 定义 如 下 : 
1， Gi 与 v, 不 相 容 
P(v|c)=10，c4 与 %, 相 关 且 唯一 3) 
e Hth 
其 中 ，E 定义 为 
II^. “=0 
je aj =1 d 
1- L^. e;-l 
je Nay =1 
其 中 : h, e [OJ 表示 方法 J 不 包含 错误 的 概率 ,在 上 述 定义 中 


P(c,)- p^ x(l-p) ^. 


方法 都 


inr 


P(e| c), P(c, M Si REIR CO H 


递增 的 顺序 进行 排列 ， 选 择 


没有 包含 


含 错误 |! 


ki 
is 
Z 
全 - 
ie] 
x 
— 

| 

I 


Hp H = 


Fh 的 表达 式 ， 利 用 
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TM 为 方法 的 个 数 ， 


.将 s 和 P(e,|ci) 代 入 Ple|c), 可 


假定 p = 0.01， 即 源 程序 大 部 分 


ci | 是 目标 方法 


可 以 


最 大 似 然 估计 法 计算 
V [o1] jec), 将 得 到 的 


H, 将 Ci fi P(c | e) fl 
出 条 件 概率 值 排序 较 高 的 方法 ， 优 


先 对 其 生成 测试 数据 。 
2 ”测试 数据 生成 
测试 数据 生成 框架 分 为 预 处 理 模 块 (获取 方法 集 和 获取 
标 路 径 )、 测 试 数据 生成 模块 (文化 基因 算法 )， 如 图 4 所 示 ， 
其 中 预 处 理 模 块 是 测试 数据 生成 模块 的 前 提 ， 该 模块 主要 负责 
前 期 获取 有 序 履 盖 目 标 方法 集 ， 以 及 对 目标 方法 静态 分 析 选 择 
目标 路 径 并 提取 相关 参数 进行 算法 参数 初始 化 ， 再 利用 分 支 函 
数 构造 适应 度 函 数 ， 测 试 数据 生成 是 核心 模块 ， 该 部 分 通过 根 
据 种 群 的 适应 度 值 、 种 群 评价 、 协 作 竞 争 算 子 来 引导 种 群 向 
标 解 进化 , 最 终生 成 覆盖 目标 方法 集中 目标 路 径 的 测试 数据 集 。 
获取 方法 集 [新 版 本 程序 P | 
rn 
方法 覆盖 信息 
贝 叶 斯 定理 l— Ser] 
po Eme! 
获取 目标 中 径 。 一 一 A — 
分 支 函 数 择 桩 | 一 > ^ Hue 
参数 提取 
ETT O»HEEENT NI 
EZH l 初始 化 种 群 ”|e 一 | 测试 数据 集 T1 
UT Ht 一 一 
竞争 协作 操作 
产生 新 一 代 No 
评价 种 群 适应 性 


4 测试 数据 生成 框架 
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2.1 初始 化 种 群 


少 测试 数据 生成 个 数 ! 


在 回归 测试 数据 生 


索 算 法 在 迭代 进化 过 程 中 有 较 
更 加 快速 的 走向 全 局 最 优 
会 由 于 后 期 种 群 的 多 样 性 疡 


种 群 的 多 样 性 ， 从 而 提 
交 种群 和 部 分 原 有 测试 数 
正 交 设计 法 在 1949 4 


Ree. 


JT LSU. Flu 


更 加 均匀 的 分 布 在 求解 空 
等 人 将 正 交 设计 法 | 
高 解 的 最 优 性 和 算法 收敛 速度 


Zhang 


E 交 设计 法 初始 种 群 ， 
间 内 ， 从 而 保证 种 群 的 多 样 性 。 


高 的 进化 效率 ， 
。 但 在 算法 进化 欠 代 过 程 中 ， 
导致 出 现 早 收敛 问题 ， 为 了 保证 
归 测 试 数据 生成 效率 ， 本 文 使 用 
结合 方式 进行 种 群 初始 化 。 
口 玄 一 等 人 提出 后 一 直 广 泛 应 
可 以 使 种 群 中 个 体 


已 有 测试 数据 集 可 以 大 幅度 减 
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IER, EM 试 数据 集 扩 增 方法 


什 用 。 本 文采 用 分 支 距 离 法 设计 适应 度 函 数 ， 分 支 距离 是 指 一 
个 谓词 为 真 〈 或 为 假 ) 的 条 件 满 足 程度 22， 本 文 的 目标 是 覆盖 


53， 初始 种 群 的 多 样 性 可 保证 启发 式 搜 


有 利于 进化 算法 


d ft 


H8], 本 文采 


j 于 遗传 算法 中 保持 种 群 的 多 样 性 提 


9 设计 的 正 交 设计 法 


E 交 数组 来 进行 文化 


标 路 径 ， 即 目标 路 径 中 每 个 分 支 节 点 ， 通 过 在 各 个 分 支 中 插 
入 分 支 函数 ， 来 表示 目前 测试 数据 与 真 分 支 的 距离 f(x) ， 如 果 
分 支 距 离 小 于 等 于 0 表示 该 真 分 支 被 覆盖 ， 则 将 分 支 距离 f(x) 
为 0。 假 设 访 目标 路 径 中 含有 个 分 支 ， 则 适应 度 函 数 转化 


根据 


Bim 


提 


用 Montgomery 等 人 
车 因 算 法 的 种 群 初 


台 化 ， 其 中 ， 正 交 数 组 表示 为 LC), m 为 正 交 数组 的 行 数 ， 


表示 测试 次 数 或 测试 用 例 数 ， 
对 象 的 个 数 ，j 为 正 交 数组 


n 为 正 交 数组 的 列 数 ， 表 示 被 沉 
的 码 数 , 表示 被 测 对 象 的 位 级 数 ， 


三 


当 位 级 数 为 2 时 ， 


交 数 组 的 算法 有 行 交 换算 法 、 
本 文通 过 Hadamard H 
速 高 效 地 产生 两 位 级 数 的 正 交 数组 1， 


为 


HxH" 


w H 
Hadamard 4B[f7j 


k=|( (N +1) )/4 |x4, N — 


n 是 被 测 对 象 数 ， 接 着 


E 交 数 纪 


有 两 种 取 值 0 


ERESHE 


标 交 换算 法 或 者 拟人 拟 物 算法 ， 
E 交 数组 ， 因 为 这 种 方式 可 


一 个 Xn Ws 


— 
1 

EN 
1 

— 


mcs: e 
A 


台 化 操作 。 


2.2 适应 度 函 数 的 设计 
个 体 的 生存 能 力主 要 体现 在 个 体 的 适 
的 生存 竞争 能 力 ， 因 此 设计 合理 的 适应 度 函 


或 1。 目 


应 度 ， 


前 构造 正 


-H'xH -nl 
其 中 :矩阵 元 素 均 为 1 8-1, HT 为 转 置 矩阵 
为 一 个 nn 阶 的 Hadamard 矩阵 HTrP4 。 


， 了 为 单位 矩阵 ， 


一 个 4 阶 


+1 


üR H 是 一 个 阶 数 为 nn 的 Hadamard X 
阶 的 Hadamard 和 矩阵 为 


+H +H 
H,, = 
+H -H 


首先 ， 构 造 一 个 天 阶 的 Hadamard 矩阵 及 ， 其 中 
max(m,n), m 是 初始 种 群 数 ， 
的 行进 行 从 小 至 
成 矩阵 Hs D 
有 上 正 交 数组 L Cj) 设计 


Dp 
E 阵 表示 


| 大 排序 并 且 
i Hi 


数 具 


的 


ERE, 那么 一 个 2n 


HER 


正 交 种群 ， 再 使 用 正 交 种 群 和 部 分 已 有 测试 数据 集 进行 种 群 初 


也 是 决定 个 体 
有 至 关 重 要 的 


为 标准 化 分 支 距离 为 
fitnesi(x) -1—1.001 ^? 6) 
e En (6) 
nts f,(x)41 


适应 度 值 fitness(x) =0 的 充 要 条 件 是 X 正好 覆盖 目标 路 
径 的 各 个 分 支 。 若 fitness(x) 函数 值 越 小 ， R X R H ER, 
因此 覆盖 目标 路 径 的 测试 数据 生成 问题 可 以 转化 为 适应 度 函 数 
Jfitness(x) 的 最 小 化 问题 。 
2.3 文化 基因 算法 

文化 基因 算法 是 一 种 基于 种 群 的 全 局 搜索 和 基于 个 体 的 局 
部 启发 式 搜索 的 结合 体 25-P8, 其 优势 在 于 全 局 和 局 部 结合 的 搜 
索 策 略 P2B0。 将 问题 的 解 表 示 成 “染色 体 ”， 通 过 模拟 文化 进 
化 过 程 的 竞争 、 协 作 操 作 结合 局 部 搜索 ， 实 现 个 体 适 应 度 的 提 
高 ， 不 断 近 代 ， 逐 步 寻找 最 优 解 或 次 优 解 。 

本 节 以 利用 原 程序 P 的 测试 数据 集 TC 生成 覆盖 新 版 本 
程序 P 方法 集 的 测试 数据 为 例 ， 详 细 介 绍 本 文 方法 的 实现 步 
IR: 

输入 : 旧 程 序 PP 的 测试 数据 集 TC 和 新 版 本 程序 P: 

输出 : 覆盖 P 方法 集 的 测试 数据 集 。 

a) 抽 取 程序 方法 调用 图 ， 结 合 原 有 测试 数据 集 ， 运 行 新 版 
本 程序 ， 建 立方 法 覆盖 信息 ， 进 而 获取 得 到 履 盖 目标 方法 集 ; 

b) 依 次 选取 目标 方法 集中 的 方法 对 其 进行 静态 分 析 ， 得 到 
标 路 径 集 以 及 相关 参数 ; 

c) 逐 个 选取 目标 路 径 , 进行 分 支 函 数 插 桩 , 设 定 初始 参数 ， 
设计 正 交 种 群 ， 进 行 种 群 初始 化 Zp ; 

dj) 根据 适应 度 函 数 式 (5)(6) 计 算 种 群 P 的 适应 度 值 


M 


finess(p) ， 评 价 种 群 ; 


e) 判 断 是 否 满足 终止 条 件 , 即 生成 的 测试 数据 覆盖 己 的 
标 路 径 ， 或 达到 最 大 进化 代数 ， 如 果 满 足 终止 条 件 ， 转 步骤 D， 
否则 转 步 又 介 

f) 选 择 父 代 个 体 pi, po» 由 父 


代 个 体 通过 交叉 算 子 和 变异 


算 子 产生 子 代 个 体 0 ,0,， ， 计 算 父 代 和 子 代 适 应 度 值 及 
f, min ( fitness ( p, ), fitness( p,)) 


和 f, = min( fitness (0, ), fitness (o,)) ; 


录用 稿 


四 如果 f,>f,， 则 Zo0,0,U2Z， 
PES Randon(0,1) > y — exp(Ao/T) 接受 子 代 人 个体， 其 中 
-fo T 为 局 部 策略 


4o - f, 


hb) 通过 
i) 算 法 


3 ”实例 分 析 


变异 算 子 产 入 
结束 ， 输 出 测 


否则 ， 按 照 


Pii. 
E 新 一 代 种 群 ， 转 步骤 d) 


通过 三 角形 判定 程序 来 说 明 本 文 的 方法 。 在 原 程序 的 测试 
数据 集中 选取 测试 数据 为 为 = (12,3) m t, 


= (3,4,5) 对 本 文 方 


法 进行 说 明 。 首 先 通 过 Doxygen 抽取 新 旧版 本 程序 方法 调 
用 图 ， 再 通过 本 文 1.1 节 的 方式 计算 新 版 本 程序 方法 调用 图 中 
每 个 节点 出 边 的 平均 权重 ， 可 得 到 加 权 方 法 调用 图 ， 旧 版 本 方 
法 调用 图 和 新 版 本 加 权 方 法 调用 图 ， 如 图 $ 所 示 。 
o e 
1.0 
N {3 ( f3 
TY * 
ce 0. 75 m 
pn f8 
ps Q CM 
CO Xx 0. 25 
O 的 T 0.5 0.5 ial 
> & OU 
e 
2 图 5 旧版 本 和 新 版 本 程序 的 方法 调用 图 
2€ 其中, 方法 有 1 一 了 8 分 别 为 ，main 方法 、 构 造 方法 、 获 取 三 
O 角形 类 型 、 判 断 三 边 是 否 符合 三 角形 定义 、 获 得 三 边 长 度 、 计 
c— ” 算 两 边 之 差 、 输 出 方法 、 判 断 三 角形 类 型 。 其 中 ， 在 新 版 本 程 
O 序 中 ，_ 正 确 程序 为 


f (a,b) ifta» D). 


修复 缺陷 后 包含 错误 的 程序 为 
f, (a.b)[- -if (as b)---] . 
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根据 新 旧版 本 方法 覆盖 信息 ， 可 得 到 履 盖 目标 方法 集 为 
c,-(«f.f5kf»] ， 通 过 最 大 似 然 估计 得 到 
h,20.6/5,-0.8h, 20 ， 再 通过 公式 (计算 得 到 : 
P(c, |e)=0.042367, P(cs |e)=0.372826,，P(cs1e)=0。 因 此 
覆盖 方法 集 为 Ce — Ls o f) ; 将 Ch 和 源码 作为 测试 数据 生 
成 模块 的 输入 ， 优 先 对 fo 进行 静态 分 析 ， 获 取 到 被 测 对 象 数 
n —3 MERRER Path= {pP} ， 依 次 选择 pi ,ps 为 目标 路 
径 ， 插 入 分 支 函 数 ， 采 用 2. 节 方 法 设计 初始 种 群 ， 进 行 种 群 


初始 化 ， 评 价 种 群 适应 性 ， 若 满足 输出 条 件 ， 则 结束 算法 ， 否 


MARETE, ESERI 


标 路 径 的 测试 数据 或 达到 最 大 


过 代 次 数 为 止 。 
4 ”实验 与 分 析 


4.1 


实验 设置 
为 验证 本 文 方法 的 
角形 判定 分 类 程序 Triangle、 


了 效 性 ， 选 取 四 个 基 ; 
6 门 子 工业 程序 


程序 ， 分 别 是 三 
集中 的 Schedule 


和 Tcas 以 及 程 NextDay。 其 基本 信息 如 表 2 所 示 。 


表 2 被 测 程序 信息 
程序 行 数 ”方法 数 KOA 输入 范围 
Triangle 50 8 3 [0.100] 
Schedule 412 18 可 变 [0,2047] 
Tcas 138 9 12 [0,10000] 
NextDay 60 2 3 [0,10000] 


分 析 测 试 数据 t,t, TERT RREA 12508 i de s ln 1 所 示 。 
表 1 新 旧版 本 方法 覆盖 信息 
Pa Pa P new 

方法 ho&«à t e& t e t e 
fl— main) 1 1 1 1 1 1 1 1 
f2—Triangle() 1 1 1] 1 1 1 1 1 
f3 getType() 1 1 1 1 1 1 1 1 
f4-isTriangle() 1 1 1 1 1 0 1 0 
f5-getBorders) 0 0 1 1 0 0 1 1 
f6difüfBordrs) 0 0 1 1 0 0 1 0 
f7 pTypeQ 1 1 1 1 1 1 1 1 
f8o judgeType 无 无 无 无 0 0 0 0 


实验 程序 均 用 Java 语言 编写 ， 计 算 机 配 


为 Windows 


Intel(R) Core(TM) i5-2450M CPU @ 2.50GHz，64 位 操作 系统 ， 
程序 在 Eclipse MARS.2 4.5.2, jdk1.7.0 80 环境 下 运行 。 与 本 文 


方法 相关 的 策略 及 参数 设置 如 表 3 所 示 。 针 对 不 同 程序 独立 运 
ÍT 20 次 , 当 生 成 覆盖 到 目标 路 径 的 测试 数据 或 达到 最 大 迭代 次 
数 时 ， 终 止 算法 。 
表 3 本 文 方法 参数 设置 
算法 策略 (参数 ) 取 值 
种 群 编码 二 进 制 编码 
局 部 策略 Metropolis 准则 
选择 策略 轮 盘 赌 选择 
交叉 策略 单 点 随机 交叉 
交叉 概率 0.9 
变异 策略 单 点 变异 
变异 概率 0.3 
种 群 大 小 30 
Ig ASI AA 1000 
XA 基准 算法 的 参数 设置 
方法 算法 参数 取 值 
随机 法 随机 种 子 与 输入 范围 相关 
do 变异 概率 0.9 
交叉 概率 0.3 
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chinaXiv 


录用 入 
学 习 因 子 e -c,-2 
粒子 群 法 — mT 
种 群 编码 二 进 制 编码 
公用 参数 种 群 大 小 30 
最 大 迭代 次 数 1000 
42 实验 结果 
为 验证 本 文 方法 的 有 效 性 ， 选 择 基于 遗传 算法 CGA) 和 基 


于 粒子 群 算法 (PSO) 以 及 随机 法 与 本 文 方法 进行 比较 ， 在 相 
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Chin 
sac eda 


4b SPET AAH Uode P (003 E EU 


H ORERE uico 


ooooc 
ON »É»o0H-2 


[AKTE F4 5I SERRE. idc HE pu OR T TRE SF UAR 图 6 针对 Teas 生成 测试 数据 覆盖 率 对 比 图 
数 和 耗 时 ， 实 验 结果 如 表 5 和 6 所 示 。 在 相同 条 件 下 ， 在 实验 源码 中 使 用 MuJava TREASA 
表 5 不 同方 法 生成 测试 数据 时 迭代 次 数 体 ， 使 用 的 变异 算 子 如 表 7 所 示 。 
进化 代数 表 7 变异 算 子 描述 
程序 指标 » 还 ih 
GA PSO 随机 本 文 方法 变异 算 子 描述 变异 算 子 描述 
均值 9.0 6.5 50.3 3.3 AOI 算术 运算 符 插 入 LOI 逻辑 运算 符 插入 
Triangl 
S 标准 差 8.6 3.2 19.7 0.9 ROR 关系 运算 符 蔡 代 SDL 语句 删除 
均值 678.4 145.2 1000.0 73.8 COR 条 件 运 算 符 蔡 代 VDL 变量 删除 
Schedule 
标准 差 27.3 16.5 0.0 72 COI 条 件 运算 符 插入 ODL 运算 符 删除 
均值 189.3 49.1 1000.0 26.9 四 种 方式 生成 的 测试 数据 分 别 运行 变异 后 程序 ， 其 中 变 
Tcas 
OSO m 351 73 00 34 异 程序 所 使 用 的 变异 算 子 以 及 测试 数据 个 数 如 表 8 所 示 。 
均值 57.4 28.8 519.5 14.1 表 8 实验 程序 描述 
NextDay 
标准 差 31.2 5.4 120.8 2.1 原 测 试 数据 现 测试 数据 
程序 变异 算 子 
表 6 不 同方 法 生成 测试 数据 时 的 耗 时 集 集 
运行 时 间 /s Triangle ^— AOLSDL,ODL;ROR,COR,LOI 60 100 
EO 指标 
GA PSO 随机 本 文 方法 Schedule AOLSDL,ROR,LOLCOLODL 300 380 
均值 0.228 0.172 0.892 0.072 Tcas AOLSDL,ODL,ROR,COR,LOLCOLSDI 210 290 
Triangl 
JUST 标准 差 0.209 0.056 0.224 0.028 NextDay AOLSDL,ROR,LOI 120 180 
均值 9.112 6.117 16341 4.172 当 一 个 测试 数据 能 够 从 结果 上 区 分 原 程 序 和 某 变异 体 ， 则 
Schedul us. ESO 
CEU hg — 0948 — 0423 — 0513 — 0394 称 该 变异 体 被 杀 死 ， 剩 下 未 被 测试 数据 杀 死 的 变异 体 称 为 存活 
均值 6.513 3235 11021 0.972 变异 体 ， 其 中 部 分 存活 变异 体 可 通过 完善 测试 数据 集 来 进一步 
T. 
7" — dH — 0518 —— 0201 — 0410 —— 0178 杀 死 变异 体 ， 其 中 也 存在 一 定 的 比例 的 变异 体 ， 在 语法 上 和 原 
均值 1.479 0.336 8.132 0.286 程序 有 区 别 ， 但 语义 上 和 原 程 序 完全 等 价 ， 因 此 不 能 被 任何 测 
NextD 
CUP Wut — 0413 —— 007 2571 0051 试 数据 杀 死 ， 这 类 变异 体 被 称 为 等 价 变异 体 ， 本 文采 用 变异 测 
以 表 5 中 空中 防 撞 系统 Teas 为 例 , 相 比 遗传 算法 需要 平均 试 评价 测试 数据 集 的 检 错 能 先 利 用 原 有 测试 数据 集 对 变异 
354€ 189.3 次 、 运 行 时 间 6.513 s, 粒子 群 算法 平均 迭代 49.1 次 、 nmi 
运行 时 间 3.235s， 以 及 随机 法 未 能 在 规定 的 最 大 迭代 次 数 中 完 “，” 据 集 来 执行 变异 程序 ， 实 验 结果 如 表 10 所 示 ， 通 过 表 9 和 10 
成 测试 要 求 ， 本 文 方法 只 需要 迭代 26.9 次 、 运 行 时 间 0.972 s 的 实验 结果 ， 可 以 明显 看 出 扩充 后 的 测试 数据 集 可 以 提高 被 杀 


即 可 生成 覆盖 


目标 方法 体 中 


成 方法 在 不 同 


FEE 


法 和 基于 遗传 算法 


数据 生成 效率 平均 分 别提 
此 可 看 出 本 文 方法 生成 下 


以 及 随机 


KH 


AE Iri] 


= 
LI 


次 运行 结果 求 得 的 标 ;# 


具有 较 好 的 优势 。 

同时 从 测 
试 数据 生成 方法 上 
法 生成 的 测试 数 志 


试 数据 的 


住 差 可 


的 能 力 。 


目标 路 径 的 测试 数据 。 乡 
程序 的 生成 效率 ， 本 文 方法 与 基于 粒子 群 算 
法 的 测试 数据 生成 方法 相 比 ， 测 试 
了 约 50.5% 和 78.2% 以 及 95.296. 
测试 数据 的 效率 。 
以 看 出 ， 本 文 方法 在 稳定 


T a KAUR 


中 防 撞 


mH, Ñ 


综合 各 种 生 


"- 


下 评价 不 | 
系统 Teas 为 例 ， 


时 路 径 履 盖 率 如 


图 6 


所 示 。 由 图 


1i] [n 


Epi) 


不 同方 


6 可 以 看 出 ， 


死 变异 的 个 数 ， 从 而 


降低 了 可 能 等 价 变异 体 个 数 。 
表 9 实验 结果 描述 ( 原 有 测试 数据 集 


— 


程序 变异 体 数 。” 杀 死 变异 体 个 数 ”存活 变异 体 个 数 
Triangle 325 125 200 
Schedule 622 204 418 

Tcas 482 167 315 
NextDay 340 128 212 


表 10 实验 结果 描述 ( 现 有 测试 数据 集 


— 


程序 ”变异 体 数 方法 


杀 死 变异 体 个 数 ”可 能 等 价 变异 体 


X048 
随机 法 195 130 
遗传 法 260 65 
Triangle 325 
粒子 群 法 293 32 
本 文 方法 325 0 
随机 法 249 373 
遗传 法 311 311 
Schedule 622 
粒子 群 法 373 249 
本 文 方法 498 124 
随机 法 222 260 
遗传 法 261 221 
Tcas 482 
粒子 群 法 338 144 
本 文 方法 434 48 
随机 法 170 170 
遗传 法 204 136 
NextDay 340 
粒子 群 法 272 68 
本 文 方法 323 17 
通过 实验 结果 计算 得 出 各 个 程序 的 变异 分 数 ， 其 中 ， 变 异 
mec ELE he 
均 变 异 分 数 如 表 11 所 示 ， 本 文 方法 与 随机 法 、 遗 传 法 和 粒子 群 
法 相 比 , 测试 数据 检 错 能 力 平均 分 别提 高 了 约 47.9% 和 33.696 


以 及 18.2%。 


表 11 变异 分 数 
; 变异 分 数 〈 平 均 ) 
REUS 
随机 法 遗传 法 粒子 群 法 本 文 方法 

Triangle 60 80 90 100 
Schedule 40 50 60 80 

Tcas 46 54 70 90 
NextDay 50 60 80 95 

5 ”结束 语 
在 回归 测试 中 扩充 原 有 测试 数据 集 的 完备 性 是 回归 测试 数 


新 增 的 部 分 是 区 


lu 


据 生 成 需要 解决 的 关键 问题 ， 
EDU EE 
试 数据 集 的 高 覆盖 率 和 数 ] 


E BEES 


IH 


通过 对 多 个 


法 ， 该 方法 


的 关键 点 ， 本 文 提出 一 种 基于 搜索 


的 分 层 回 ! 


前 提 ， 如 何 保证 


集 的 检 错 能 力 是 提高 回 


电 分 析 提 取出 发 生 改变 或 者 
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IL 


EFESE] T TCAE 


扩充 后 的 测 
归 测 试 效率 
数据 扩 增 方 


与 随机 法 、 


利用 遗传 算法 和 粒子 群 算法 的 
方法 进行 对 比 ， 实 验 表 明 ， 本 文 所 提出 的 方法 生成 


nu 


归 测 


进行 测试 ， 
试 数 据 生成 
的 测试 数据 


在 覆盖 率 和 测试 数据 检 错 能 力 都 有 明显 的 提高 。 

在 回归 测试 数据 生成 过 程 中 ， 利 用 程序 在 方法 粒度 的 方法 
覆盖 信息 分 析出 发 生 改变 和 新 增 的 方法 ， 再 利用 贝 叶 斯 理论 确 
认 方 法 体 中 可 能 包含 错误 的 概率 ， 对 包含 错误 可 能 性 大 的 方法 
和 新 增 方法 分 析 生 成 覆盖 目标 路 径 集 的 测试 数据 集 ， 在 一 定 程 
度 上 提高 了 测试 数据 集 的 覆盖 率 和 检 错 能 力 。 ARAM 22 
础 上 ， 下 一 步 主要 的 工作 包括 两 个 方面 ， 其 一 是 重点 扩大 实验 


规模 ; 


其 二 是 将 本 文 方 沪 


ou E Y 


软 


chinaxiy 售 作 期 天 
ESSE TARDAR 回归 测试 数据 集 扩 增 方法 


件 演化 信息 高 效 准备 的 分 析出 履 盖 履 盖 目 标 进行 
测试 数据 生成 ， 将 是 下 一 工作 中 要 重点 解决 的 两 个 问题 。 
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